Lienzo de postmortem sin culpa
Esta plantilla de Post-Mortem "sin culpas" te ayuda a reunir información sobre los incidentes que ocurrieron en producción.
Esta plantilla de Post-Mortem "sin culpas" te ayuda a recopilar información sobre los incidentes ocurridos en producción. Seguir este proceso significa que los ingenieros cuyas acciones han contribuido a un accidente pueden dar un relato detallado de:
qué acciones tomaron a qué hora,
qué efectos observaron,
expectativas que tenían,
suposiciones que habían hecho,
su comprensión del cronograma de eventos tal como ocurrieron.
y que puedan dar esta cuenta detallada sin miedo a castigos o represalias.
El postmortem Blameless incluye las siguientes secciones
Paso 1: Resumen (prellenar antes de la reunión)
Un resumen de alto nivel de la incidencia, centrándose en lo que se sabe hasta este momento y en el impacto que tuvo para el cliente. Limítalo a una o dos frases.
Paso 2: Cronograma aproximado (prellenar antes de la reunión)
Un cronograma aproximado de la incidencia. Dependiendo de lo rápido que se moviera la incidencia, este cronograma podría abarcar desde unos minutos hasta unas horas o unos días. Si tu enfoque principal es mejorar los tiempos de respuesta del equipo durante emergencias, querrás que esto se mida hasta el segundo.
Al capturar el cronograma, asegúrate de incluir:
Cuándo se reportó la incidencia y por quién/qué proceso
Qué acciones se tomaron
Cuando se estableció la comunicación dentro y fuera del equipo
Ideas de Remediación
Cuando te reúnas para discutir la incidencia, invita a todos los que trabajaron en ella. Esto incluye al equipo de soporte para la producción, así como a los miembros del equipo de atención al cliente que pudieran haber estado involucrados.
Revisa el resumen, revisa la línea de tiempo y añade las partes que falten. Luego, pasa a las ideas de remediación.
Estas preguntas están formuladas para ayudar al equipo a asumir la responsabilidad del problema. Hay algunas incidencias que parecen estar fuera del control del equipo (el centro de datos pierde energía, etc). Pero incluso en eventos como esos, el equipo aún puede mejorar su reacción al desastre.
Paso 3: Detectar – ¿Cómo detectamos este problema o un problema como este antes?
Asume que este problema o un problema muy similar ocurrirá de nuevo. ¿Cómo puede el equipo de soporte detectar este problema más rápido y encontrarlo antes de que lo haga un cliente?
Paso 4: React – ¿Cómo mejoramos nuestra reacción ante incidencias como estas?
Asume que se ha reportado la incidencia. ¿Qué tan rápida fue la reacción? ¿Se perdieron minutos mientras las personas enviaban correos intentando que alguien revisara el problema?
¿Cómo puede el equipo reaccionar más rápidamente o de manera más organizada la próxima vez que ocurra esta incidencia?
Paso 5: Solución Rápida: ¿Cómo detenemos la hemorragia más rápido?
Cuando esto vuelva a ocurrir, ¿hay un solución alternativa lista que podamos proporcionar al cliente para reducir el impacto del problema?
Si esto es algo que empeora con el tiempo (como un ataque DDoS), ¿tenemos una forma rápida de cerrar las compuertas mientras descubrimos la causa raíz?
Paso 6: Prevenir: ¿Cómo prevenimos o reducimos el impacto de incidencias similares en el futuro?
Esta es a menudo la única pregunta que los equipos hacen en un postmortem. Es una pregunta importante y deberías dedicarle mucho tiempo. Sin embargo, si te limitas a preguntar solo cómo prevenir una incidencia, te permite no asumir ninguna responsabilidad por las cosas que están bajo tu control (como la forma en que detectas, reaccionas o solucionas rápidamente una incidencia).
Mientras haces una lluvia de ideas, no te limites solo a soluciones técnicas. Mejor monitoreo, mejores vías de comunicación, mejor capacitación, asegurarse de que las personas en asistencia al cliente conozcan a las personas en asistencia de producción por su nombre, etc.
Paso 7: Otras áreas de riesgo: ¿Qué otras áreas comparten esta misma vulnerabilidad?
Cada incidencia es una pista de dónde tu sistema es débil. Es probable que, por cada incidencia que encuentres, haya docenas acechando en las sombras, aún por descubrir.
Es como si vieras un ratón en tu cocina. No tienes un problema de "ratón", tienes un problema de "ratones".
Es probable que haya otras partes del sistema que compartan los mismos supuestos de diseño o, en algunos casos, el mismo código (aunque nadie copia/pega código).
Dedica unos minutos a hacer una lluvia de ideas sobre otros lugares que sean vulnerables de manera similar.
Cuando los equipos están estresados y sobrecargados, omitirán este paso. Encuentro que esta es la pregunta más importante que hacer para lograr que el equipo tenga una mentalidad proactiva y reducir la aparición de incidencias en el futuro.
Paso 8: Próximos pasos (Acciones)
Después de haber identificado todas las cosas posibles que puedes hacer para mejorar cómo se detectan, reaccionan, corrigen rápidamente y previenen las incidencias... y haber encontrado las otras áreas de tu aplicación que necesitan atención... pasa a decidir qué acciones tomar.
La forma en que priorizas esto depende de ti. Pero tengo algunos consejos.
Consigue un nombre y una fecha para cada uno que planees ejecutar antes de salir de la reunión
Si alguien en la reunión está entusiasmado con tomar una de las acciones, anímalo a hacerlo, incluso si piensas que podría no ser lo más importante a solucionar.
Nombres y fechas
En general, he encontrado que a los equipos les gusta este ejercicio (siempre que puedas crear un ambiente sin culpas para la reunión). Les gusta analizar el problema y hacer lluvias de ideas para encontrar soluciones. Sin embargo, todos se sienten ocupados y sobrecargados de trabajo. A menos que esta reunión concluya con propietarios y fechas junto a las cosas que deben hacerse, lo más probable es que ninguna de las mejoras ocurra.
Lo que sucederá es que dentro de 3 semanas, cuando el mismo problema ocurra en producción (pero esta vez de manera más grande), alguien dirá: "oh sí, hablamos sobre arreglar eso." No es un gran lugar para estar.
Para combatir eso, simplemente asegúrate de que haya un nombre y una fecha junto a cada acción que el grupo quiera realizar.
Basado en David Frink Blameless Postmortem Canvas.
Comienza ahora mismo con esta plantilla.
Plantilla de informe Kaizen
Ideal para:
Metodología Agile, Operaciones, Documentación
¿Qué hace grande a una gran empresa? Saben que la grandeza debe fomentarse y mantenerse, lo que significa que nunca dejan de trabajar para mejorar. Si eres una de esas empresas (o aspiras a serlo), un informe Kaizen es una herramienta ideal. Crea una guía visual simple para las actividades de mejora continua a nivel de equipo, departamento y organización. Utilizando un enfoque del método kaizen, cada empleado de una organización audita sus propios procesos y comprende lo que podrían haber pasado por alto, lo que lo convierte en una herramienta poderosa para aumentar la responsabilidad en todos los niveles.
El lienzo del equipo
Ideal para:
Agile
El Team Canvas es una herramienta versátil para alinear objetivos, roles y procesos. Proporciona un marco estructurado para definir el propósito, aclarar responsabilidades y visualizar el entorno de trabajo. Al fomentar la comunicación abierta y el entendimiento compartido, esta plantilla facilita la colaboración e incrementa la cohesión del equipo, empoderándote para crear una visión compartida y alcanzar el éxito colectivo.
Juego de iteración de rompecabezas Scrum
Ideal para:
Agile, Juegos, Rompehielos
El Juego de Iteración de Rompecabezas Scrum es una actividad práctica que refuerza los principios y prácticas de Scrum. Al simular ciclos de desarrollo iterativo a través de la resolución de rompecabezas, los equipos aprenden la importancia de la colaboración, la adaptabilidad y la mejora continua. Esta plantilla ofrece una manera divertida y atractiva de internalizar los conceptos de Scrum y mejorar el trabajo en equipo, empoderando a los practicantes de Agile para entregar valor de manera más efectiva.
Retrospectiva de las 4P
La plantilla Retrospectiva 4Ps ofrece un marco estructurado para que los equipos reflexionen sobre iteraciones o proyectos pasados utilizando el modelo 4Ps (Elogios, Problemas, Posibilidades y Planes). Proporciona elementos para compartir comentarios positivos, identificar desafíos, explorar oportunidades y establecer planes de acción. Esta plantilla habilita a los equipos a realizar retrospectivas de manera sistemática, generar ideas prácticas y fomentar la mejora continua. Al promover un enfoque equilibrado e integral, la retrospectiva de las 4P permite a los equipos mejorar la colaboración, aumentar la moral y alcanzar sus objetivos de manera eficaz.
8 maneras diferentes de organizar tu backlog
Ideal para:
Agile
Explora 8 técnicas diferentes para gestionar y priorizar el trabajo de manera eficaz con esta plantilla. Desde matrices de priorización hasta la creación de mapas de historias, ofrece una visión global de las estrategias de gestión del backlog. Al comprender las fortalezas y limitaciones de cada enfoque, los equipos pueden adaptar la organización de su backlog para optimizar el flujo de trabajo, lo que permite a los equipos mantenerse organizados y enfocados en entregar valor.
Retrospectiva del Velero de Medianoche
Ideal para:
Retrospectivas, Reuniones, Metodología Agile
La plantilla Retrospectiva del Velero de Medianoche ofrece un viaje metafórico a través de experiencias pasadas y aspiraciones futuras, comparando el proceso de retrospectiva con un viaje en velero a medianoche. Proporciona elementos para reflexionar sobre los desafíos enfrentados, las lecciones aprendidas y los objetivos para el futuro. Esta plantilla habilita a los equipos para navegar las incertidumbres, trazar un rumbo hacia el éxito y fomentar una cultura de resiliencia. Al promover la reflexión y el pensamiento metafórico, la retrospectiva del velero de medianoche capacita a los equipos para superar obstáculos, aceptar el cambio y navegar hacia sus metas de manera efectiva.